import sys
import os

sys.path.insert(0, os.path.abspath(os.path.join(os.path.dirname(__file__), "..")))

from tesseract_utils import extract_text_from_image
import pytesseract

if __name__ == "__main__":
    # --- 使用示例 ---
    print("--- Tesseract OCR 中文提取示例 ---")

    # 请将下面的路径替换为您自己的图片路径
    # 这张图片应该包含一些清晰的中文文字
    sample_image_path = "D:/temp/pic/test/ocr_02.png"  # <--- 替换我

    if sample_image_path == "path/to/your/chinese_text_image.png" or not os.path.exists(
        sample_image_path
    ):
        print(f"\n警告: 示例图片路径 '{sample_image_path}' 不存在或未修改。")
        print(
            "请修改 ocr_utils.py 文件中的 `sample_image_path` 为您本地的图片路径后再运行此脚本。"
        )
    else:
        try:
            print(f"\n正在从图片中提取文字: {sample_image_path}")
            # 调用函数，并指定语言为简体中文 ('chi_sim')
            # 调用函数，并同时启用预处理和超分辨率功能
            extracted_text = extract_text_from_image(
                sample_image_path,
                lang="eng+chi_sim",
                enable_preprocessing=True,
                use_super_resolution=True,
            )

            print("\n--- 提取结果 ---")
            if extracted_text:
                print(extracted_text)
            else:
                print("未能从图片中提取任何文字。请检查图片是否清晰、文字是否可读。")
            print("------------------")

        except (
            FileNotFoundError,
            pytesseract.TesseractNotFoundError,
            RuntimeError,
        ) as e:
            print(f"\n错误: {e}")
